全身追踪器用于监视和安全目的,例如人跟踪机器人。在中东,统一的人群环境是挑战最新跟踪器的常态。尽管过去文献中记录的跟踪器技术有了很大的改进,但这些跟踪器尚未使用捕获这些环境的数据集进行了培训。在这项工作中,我们在统一的人群环境中开发了一个带有一个特定目标的注释数据集。该数据集是在四种不同的情况下生成的,在四种不同的情况下,目标主要是与人群一起移动,有时会与它们阻塞,而其他时候,相机的目标视图在短时间内被人群阻止。注释后,它用于评估和微调最新的跟踪器。我们的结果表明,与初始预训练的跟踪器相比,基于两个定量评估指标的微调跟踪器在评估数据集上的性能更好。
translated by 谷歌翻译
移动对象检测(MOD)是许多计算机视觉应用程序的基本步骤。当从静态或移动的摄像机捕获的视频序列遇到挑战时,MOD变得非常具有挑战性:伪装,阴影,动态背景和照明变化,仅举几例。深度学习方法已成功地应用于竞争性能。但是,为了解决过度拟合的问题,深度学习方法需要大量标记的数据,这是一项艰巨的任务,因为始终无法提供详尽的注释。此外,某些MOD深度学习方法显示了在看不见的视频序列存在下的性能下降,因为在网络学习过程中涉及相同序列的测试和训练分裂。在这项工作中,我们使用图形卷积神经网络(GCNN)提出了MOD作为节点分类问题的问题。我们的算法被称为GraphMod-NET,包括实例分割,背景初始化,特征提取和图形结构。在看不见的视频上测试了GraphMod-NET,并且在无监督,半监督和监督的学习中,在2014年变更检测(CDNET2014)和UCSD背景减法数据集中的最先进方法进行了测试。
translated by 谷歌翻译
筛选行李X射线扫描的筛选杂乱和闭塞违禁品,即使对于专家的安全人员而言,甚至是一个繁琐的任务。本文提出了一种新的策略,其扩展了传统的编码器 - 解码器架构,以执行实例感知分段,并在不使用任何附加子网络或对象检测器的情况下执行违反互斥项的合并实例。编码器 - 解码器网络首先执行传统的语义分割,并检索杂乱的行李物品。然后,该模型在训练期间逐步发展,以识别各个情况,使用显着减少的训练批次。为了避免灾难性的遗忘,一种新颖的客观函数通过保留先前获得的知识来最小化每次迭代中的网络损失,同时通过贝叶斯推断解决其复杂的结构依赖性。对我们两个公开的X射线数据集的框架进行了全面评估,表明它优于最先进的方法,特别是在挑战的杂乱场景中,同时在检测准确性和效率之间实现最佳的权衡。
translated by 谷歌翻译
检测行李中的非法和威胁物品是最大的安全问题之一。即使对于经验丰富的安全人员来说,手动检测也是一种耗时和压力的任务。许多学者都创建了自动框架,用于检测行李X射线扫描的可疑和违禁品数据。然而,为了我们的知识,不存在利用时间行李X射线图像的框架,以有效地筛选高度隐藏和闭塞物体,即使赤裸的眼睛也几乎看不到。为了解决这个问题,我们提出了一种新型的时间融合驱动的多尺度残余方式编码器 - 解码器,将一系列连续扫描作为输入,并融合它们以产生可疑和不可疑行李内容的不同特征表示,导致更准确提取违禁品数据。使用可公开访问的GDXRAY数据集已彻底测试所提出的方法,该数据集是包含时间链接的灰度X射线扫描的唯一数据集,其展示了极其隐藏的违禁品数据。拟议的框架在各种度量标准上的GDXRay数据集上占据了竞争对手。
translated by 谷歌翻译
视网膜疗法代表一组视网膜疾病,如果不及时治疗,可能会导致严重的视觉障碍甚至失明。许多研究人员已经开发了自治系统,通过眼底和光学相干断层扫描(OCT)图像识别视网膜病变。然而,大多数这些框架采用传统的转移学习和微调方法,需要一种非常良好的注释训练数据来产生准确的诊断性能。本文提出了一种新型增量跨域适应仪,可以通过几次拍摄培训允许任何深度分类模型逐步学习OCT和眼底图像的异常视网膜病理。此外,与其竞争对手不同,所提出的仪器通过贝叶斯多目标函数驱动,不仅执行候选分类网络,不仅在增量培训期间保留其先前学到的知识,而且还确保网络了解先前学习的结构和语义关系病理学和新增的疾病类别在推理阶段有效地识别它们。所提出的框架,在用三种不同的扫描仪获得的六个公共数据集中评估,以筛选十三个视网膜病理,优于最先进的竞争对手,通过分别实现了0.9826和0.9846的整体准确性和F1得分。
translated by 谷歌翻译